UFABC - ESTI019 - Codificação de Sinais Multimídia

LaboratĂłrio 6 - PDS da Voz

Prof. MĂĄrio Minami </h2>

OBJETIVOS:

  1. Gravar Arquivos de Áudio com dĂ­gitos, nĂșmeros gerais, texto lido e poesia
  2. Leitura de Arquivos de Áudio e janelamento
  3. CĂĄlculo das Energias de Tempo Curto
  4. CĂĄlculo dos Espectrogramas
  5. Determinação do Pitch, da FrequĂȘncia Fundamental e das Formantes ($f_1$ a $f_4$) de Algumas Vogais
  6. Determinação de fonemas surdos, sonoros, consoantes gerais e plosivos

1. Gravar Arquivos de Áudio com dígitos, números gerais, texto lido e poesia

Usando o Audacity, ou outro programa de ĂĄudio, grave arquivos com:

Carregando ĂĄudios gravados

2. Leitura de Arquivos de Áudio e janelamento

2.1 Definição dos Parâmetros da Análise

2.2 Obtendo uma Janela de Hamming

3. Energia de Tempo Curto

3.1 Cálculo para arquivo de teste

3.2 Agora leia os seus arquivos gravados e:

Determine o Contorno de Energia para trĂȘs arquivos que vocĂȘs gravaram:

  1. dĂ­gitos
  2. voz falada
  3. voz declamada (poema)

4. Espectrogramas

4.1 Visualização do Espectrograma para Arquivo de Teste

4.2 Agora com os seus arquivos

Faça os espectrogramas para os arquivos que vocĂȘs gravaram e calculem o contorno de energia:

5. Determinação do Pitch e da F0

5.1 Pitch do Arquivo Teste1

O PerĂ­odo de Pitch ($T_{0}$) serĂĄ o intervalo entre picos sucessivos
($T_{0}$) = 3.5 ms
A FrequĂȘncia Fundamental ($f_0$) serĂĄ o inverso do periĂłdo de Pitch
($f_0$) =~ 288 Hz

5.2 Pitch do Arquivo Teste2

Determine o PerĂ­odo de Pitch e a Fundamental desta vogal.

O PerĂ­odo de Pitch ($T_{0}$) serĂĄ o intervalo entre picos sucessivos
($T_{0}$) = 4.5 ms
A FrequĂȘncia Fundamental ($f_0$) serĂĄ o inverso do periĂłdo de Pitch
($f_0$) =~ 222 Hz

Agora com cada um dos seus arquivos:

Determine o Pitch e a $f_0$ da vogais que desejarem dos seus arquivos, para as versÔes:

  1. DĂ­gitos
  2. Falada
  3. Declamada

1. Dígitos

PerĂ­odo de Pitch e a Fundamental - "Do" do nĂșmero "Dois"

O PerĂ­odo de Pitch ($T_{0}$) serĂĄ o intervalo entre picos sucessivos
($T_{0}$) = 6.0 ms
A FrequĂȘncia Fundamental ($f_0$) serĂĄ o inverso do periĂłdo de Pitch
($f_0$) =~ 167 Hz

2. Falada

PerĂ­odo de Pitch e a Fundamental - "ga" da palavra "folgado"

O PerĂ­odo de Pitch ($T_{0}$) serĂĄ o intervalo entre picos sucessivos
($T_{0}$) = 6.0 ms
A FrequĂȘncia Fundamental ($f_0$) serĂĄ o inverso do perĂ­odo de Pitch
($f_0$) =~ 167 Hz

3. Declamada

PerĂ­odo de Pitch e a Fundamental - "a" da palavra "alegre"

O PerĂ­odo de Pitch ($T_{0}$) serĂĄ o intervalo entre picos sucessivos
($T_{0}$) = 8.8 ms
A FrequĂȘncia Fundamental ($f_0$) serĂĄ o inverso do perĂ­odo de Pitch
($f_0$) = 113.6 Hz

5.3 Determinação das Formantes

5.3.a Formantes do trecho de teste

5.3.b Os quatro primeros picos no espectro são as formantes $f_1$ a $f_4$

$f_1$ = 250 Hz $f_2$ = 500 Hz $f_3$ = 750 Hz $f_4$ = 1000 Hz

5.4 Agora com seus arquivos

Determine as formantes das vogais dos arquivos que vocĂȘs calcularam os espectrogramas

$f_1$ = 980 Hz $f_2$ = 1150 Hz $f_3$ = 2480 Hz $f_4$ = 2600 Hz

$f_1$ = 1070 Hz $f_2$ = 1510 Hz $f_3$ = 2280 Hz $f_4$ = 3050 Hz (fora do grĂĄfico, observado com auxĂ­lio do Audacity)

$f_1$ = 460 Hz $f_2$ = 620 Hz $f_3$ = 2330 Hz $f_4$ = 3077 Hz (fora do grĂĄfico, observado com auxĂ­lio do Audacity)

6. Determinação de Consoantes e Plosivos

Usando alguns de seus arquivos, no espectrograma, determine algumas consoantes e em especial as plosivas

Camões

Utilizando o Audacity, determinei os intervalos que continham as consoantes desejadas